Learning Dexterous In-Hand Manipulation
ロボットハンド
で
立方体
を
回転
させる
OpenAI
2018
実環境
の完全な
モデル化
は不可能
Domain Randomization
考えうるすべてをランダム化(個別?同時?)
長さ,重さ,摩擦係数,
観測誤差
,
制御誤差
,
遅延
, オブジェクトに加わる
力
,
カメラ
の位置,
照明
の設定,
ハンド
とオブジェクトの位置・向き・
テクスチャ
,...
ランダム化ありとなしでは実世界でのテスト成功率に大きな差
Asymmetric Actor-Critic
PPO
実験設定
Shadow Hand
を使用
入力設定1:
モーションキャプチャ
した姿勢
LEDマーカ
により指5本と立方体をキャプチャ
実環境での追加学習無しで平均20連続回転
入力設定2:3つのカメラ画像
RGBカメラ
3台
同平均15連続回転
計算資源
8 NVIDIA V100 GPUs
6144 CPU cores
50 hours
https://gyazo.com/99381ea84aaa2d59d5b8b074b110d8bd